Найти в Дзене
Новая GPT-Image 1.5: а вы уже успели отойти от Nano Banana Pro? Только все привыкли к возможностям Nano Banana Pro, как подоспела новая звезда — GPT-Image 1.5. И да, она уже доступна в Холст.ИИ! Чем она впечатляет? - Еще лучше понимает контекст — сложные промпты, настроение, детализированные описания. - Четче и реалистичнее — картинки выглядят, как профессиональные фотографии или отрисованные иллюстрации. - Креатив без границ — от гиперреализма до абстрактного арта. - Ещё лучше работает в паре с референсами — соблюдает исходные элементы, цвета и стили более точно. А еще — специально к концу года, мы добавили мощную модель для генерации видео — Wan 2.6! 🎁 Новогоднее предложение Также, только до 31 декабря действует скидка на наш ежемесячный тариф. Переходите по секретной ссылке и генерируйте ещё выгоднее! Желаем новых творческих идей и счастливых моментов в Новом Году!
1 неделю назад
Мы записали для вас демо-видео про Холст! Рекомендуем к просмотру: ⚡️Если вы недавно зарегистрировались на платформе; ⚡️Если у вас есть сложности в коммуникации с сервисом; ⚡️Если хотите не упустить инструменты, которые не заметили при самостоятельном пользовании. Оно так же доступно на главной странице Холст.ИИ - не пропустите следующие выпуски!
2 недели назад
Про Seedream-4.5 и Google Workspace Studio Bytedance представили новую версию Seedream 4.5 - улучшена консистентность, работа с текстом и редактирование нескольких изображений сразу. Среди примеров встречаются создание текста для постеров и дизайнерской рекламы, соединение до 14 изображений, чёткое следование инструкциям. Более интересный релиз, с практической точки зрения - Google Workspace Studio Во всех Business и Enterprise планах теперь можно делать такие воркфлоу вместо n8n: → Сделай мне краткий обзор всей непрочитанной почты → Когда я получаю имейл с негативом, заготовь авто-ответ → После встречи в Google Meet, подготовь список задач со сроками и отправь его участникам на почту → За 5 минут до встречи, напомни мне список участников, тему и важные файлы в чате → Помечай все имейлы с важными рабочими вопросами особым тегом А также - помимо продуктов Google вроде Sheets, Docs, Meet, Forms, Chat, Gemini - есть интеграции с Asana, Jira, Salesforce, Mailchimp и другими сторонними провайдерами. Это похоже на тул, который поможет большинству извлечь из AI максимум пользы прямо сейчас. (shameless plug) Мы в Bearle можем вам с этим помочь - пишите мне, на почту или в директ канала. Картинки - Bytedance Seedream 4.5 Видео - Bytedance Seedream 4.5, Google Workspace Studio #AI #Seedream #Bytedance #WorkspaceStudio
3 недели назад
Про Runway Gen-4.5 ( Whisper Thunder ), и немного "лайфхаков" по Nano Banana Pro Играя с Nano Banana Pro, заметил, что открывается много интересных возможностей - она и с текстом лучше работает, и в целом лучше следует всем инструкциям (не забывая некоторые). Поэтому хотел поделиться такой репой с интересными штуками и промптами, может кому-то тоже будет полезной github.com/...proo Особенно интересны примеры промптов в JSON и инфографика / флипбуки. Попробовать Nano Banana Pro можно на Холст.ИИ (full disclosure - имею прямое отношение к сервису) Но Runway выпустили "убийцу" Veo3.1 от Google под названием Runway Gen-4.5, заявляя о первом месте на пьедестале видео-моделей (пусть и с небольшим отрывом).  Отличительная её особенность в понимании сложных, последовательных инструкций, кинематографичные результаты - а минусы включают в себя предрасположенность к успеху (кривой удар всё равно приводит к голу), пропадающие/появляющиеся объекты и эффекты, которые проявляются раньше событий. Видео - примеры Runway Gen-4.5, обзорное видео и презентация Картинки - ELO сравнение с другими видео-моделями #AI #Runway #Gen4.5 #NanoBananaPro #Veo31
4 недели назад
Про Deepseek 3.2 + Special, и Quark AI от Alibaba Создатели Китовой модели порадовали нас версией Deepseek V3.2 и думающей Deepseek V3.2-Special. Модели соревнуются с GPT-5 High, Gemini 3 Pro и Claude 4.5 Sonnet, а также обладают новой возможностью - "Thinking in tool use", то есть размышление при вызове инструментов (вроде MCP-серверов, файловой системы и т.д.) Что радует - модель полностью открыта и бесплатна, и доступна на HF для загрузки:huggingface.co/...3.22 Другая китайская команда из Alibaba (Cloud которых я недавно хвалил)  ставила очередной AI-браузер, под названием Quark Фактически, они просто сделали ребрендинг Quark браузера (у которого, кстати, 100 млн+ юзеров), добавив в него кучу разных нативных интеграций Qwen - Qwen Screen Reader, Qwen Chatbot Quick Bar, Qwen Sidebar, Qwen Text Selector, и Qwen Screenshot. По крайней мере, это хорошо с той точки зрения, что американских гигантов релизы со стороны китайцев подстёгивают не лениться и не отставать. Картинки - Quark AI, Deepseek V3.2 #Deepseek3.2 #QuarkAI #Alibaba #AI
1 месяц назад
“ТОП - 4 совета по использованию Nano Banana для лучших результатов” С момента релиза в конце августа, новая модель изображений Nano Banana стала основой для более 5 миллиардов изображений. Пользователи по всему миру находят ей самое разное применение — от обработки портретов для деловых профилей до генерации впечатляющих фантастических сцен. Вот несколько советов, которые вы можете использовать для лучших результатов: 1. Пишите четкие и конкретные подсказки для модели. Результат работы Nano Banana практически полностью зависит от качества предоставленных вами инструкций. Он не умеет читать мысли, а общие подсказки заставляют его гадать, что вы имеете в виду, и это часто приводит к тому, что изображения кажутся некорректными или требуют многократного редактирования. Чтобы избежать разочарования, относитесь к своим подсказкам как к подробному заданию, которое вы бы дали дизайнеру-человеку: полному, наглядному и продуманному. 2. Используйте цепочку правок для сложных изменений. Работая над проектом, требующим внесения нескольких изменений, возникает соблазн упаковать всё в одну строку и надеяться, что Nano Banana сама разберётся. Несмотря на всю мощь инструмента, слишком большое количество инструкций может перегрузить систему и привести к некорректным изображениям. Более разумный подход — выстраивать цепочку правок шаг за шагом, разбивая процесс на более мелкие и легко выполнимые задачи. Nano Banana разработан для сохранения идентичности и стилистического единообразия при каждом редактировании. Работая над одним изменением за раз, вы снижаете вероятность внесения ошибок и получаете больший контроль над конечным результатом. 3. Поддерживайте последовательность для идентичности изображения. Лица, объекты или элементы бренда остаются узнаваемыми и целостными при различных редакциях или версиях изображения - это одно из основных преимуществ Nano Banana. Для авторов, работающих над проектами с повторяющимися персонажами, логотипами компаний или визуальными образами продуктов, эта функция — настоящая находка. Вместо того, чтобы каждый раз начинать с нуля, вы можете сохранять привычный облик, внося необходимые коррективы. Это гарантирует, что при ретуши, перекраске или изменении стиля изображения основная индивидуальность человека останется неизменной. Например, вы можете изменить одежду или фон, сохранив при этом форму лица и выражение. 4. Избегайте противоречивых инструкций. Будьте осторожны и не перегружайте запросы противоречивыми правками, например, «сделать человека старше, но сохранить лицо тем же». Конфликтующие запросы могут сбить ИИ с толку и привести к искажению результатов. Вместо этого разбейте правки на этапы и определите, какие аспекты личности должны оставаться неизменными. Благодаря советам, Nano Banana может стать незаменимым инструментом в вашей работе. Это всего четыре рекомендации, если хотите узнать больше о фишках использования Nano Banana, пишите в комментариях. На фото 2 примера разных промтов. Использовали модель на платформе Холст.ИИ #AI #NanoBanana #Prompt
1 месяц назад
Про Hunyuan Z-Image, Hunyuan OCR и не-фиолетовые дизайны от Claude Code Те из вас, кто хоть раз пробовал делать сайты с помощью нейросетей (Lovable, Claude, ChatGPT, Cursor и т.д.) - знают, как сложно заставить их сделать хоть что-то оригинальное. Особенное пристрастие у них наблюдается к градиентам с фиолетовым цветом, а все кнопки обязательно должны быть синие. Anthropic клянутся, что решили эту проблему с помощью плагина "frontend-design" для Claude Code - посмотреть результат можно на приложенном видео (как поставить напишу в комментариях). Также можно попробовать Claude Opus 4.5 бесплатно на v0.app - спешите, халява временная. Китайцы сделали сразу два интересных релиза - это супер-быстрая модель Z-Image от Alibaba, которая может работать на потребительских GPU, а также SOTA (State-of-the-art) модель для распознавания текста (OCR) под названием Hunyuan OCR от Tencent.  Модель для генерации изображений Z-Image имеет всего 6млрд параметров, что позволяет ей работать на GPU c 16Гб памяти и меньше, и генерировать изображения меньше чем за секунду.  Галерея  Github А вот HunyuanOCR может похвастаться рейтингом 860 на бенчмарке OCRBench, умеет работать с графиками, формулами LaTeX, субтитрами к видео, таблицами - и даже переводить текст на фото. Попробовать можно тут (всё на китайском) Я пока что пользуюсь Qwen-VL, по простой причине - мне её хватает :) Да и в целом экосистема Alibaba Cloud очень удобная, настолько - что не хочется переключаться. Если кто не знал - у них например продаются домены по $1.99. Картинки - Hunyuan OCR, Alibaba Z-Image, Claude Opus 4.5 Frontend Skills Видео - Claude Opus 4.5 Frontend #AI #Hunyuan # Claude #Anthropic #Z-Image #Alibaba #OCR #Tencent #Opus4.5
1 месяц назад
Про опыт использования Google Antigravity и Claude Opus 4.5 Хотел поделиться опытом своего использования Google Antigravity и применения моделей Google и Anthropic в ней, а также Nano Banana Pro. Возможно, некоторые из вас в курсе, что я плохо перевариваю интерфейс VS Code, на котором основаны Cursor и Antigravity (и другие AI-IDE), вместо них я предпочитаю проверенные и профессиональные продукты Jetbrains. Тем не менее, в данном случае я решил поступиться принципами и провёл 24 часа за "штурвалом" Antigravity, управляя сворой агентов на основе разных моделей - бесплатные лимиты Gemini 3 Pro закончились довольно быстро (где-то через 30 мин использования), но на то они и бесплатные. Приятно удивил тот факт, что в качестве fallback-модели дают настоящую Claude Sonnet 4.5, а на худой конец есть GPT-OSS 120B Medium (до неё я не дошел, что называется, до ручки). Конечно, с точки зрения кода многое пришлось допиливать напильником, но сгенерированные Nano Banana Pro картинки отличались высоким качеством и чётким текстом, а планы и проектная документация от Gemini 3 Pro - вложенным в неё смыслом, и почти полным отсутствием "ии-змов", которые набили оскомину за это время (YMMV, опыт у всех разный). Результат можете посмотреть тут: https://launchneobank.com/ - в общем, рекомендую всем попробовать Antigravity (предложения на сайте реальные, если что). А Anthropic порадовала нас (меня по крайней мере весьма) новой мощной моделью под названием Opus 4.5, которая быстрее/выше/сильнее Sonnet 4.5 по разным оценкам на 5% (в swe-bench verified) и до 42% (в tool use). Модель, по заверениям разработчиков, их лучшая на текущий момент. Она понимает вас с полуслова, имеет поиск по инструментам (tool search), умеет спрашивать уточняющие вопросы заранее и доступна в Excel. Новые механизмы вызова заполняют окно контекста меньше и позволяют ей быстрее находить ответы, при этом увеличивая время автономной работы. Картинки - Claude Opus 4.5 Видео - Google Antigravity, Claude Opus 4.5 #AI #Claude #Antigravity #Anthropic #Opus
1 месяц назад
Про первоначальные впечатления о Gemini 3, Google Antigravity и Nano Banana Pro. Судя по заявлениям Google, обновления по продуктам с Gemini 3 мы будем получать еще долго (скорее всего, до Нового Года) - а пока что я начал использовать, смотреть и интересоваться, и могу поделиться первыми впечатлениями. Начнём с релиза Antigravity, вот здесь можно посмотреть очень хороший гайд по тому как пользоваться (всего 14 минут) - это что-то вроде Lovable + Cursor в одном флаконе, который к тому же умеет генерировать картинки с Nano Banana Pro (про неё позже) - при этом, умеет пользоваться вашим хромом (с помощью расширения) и тестировать всё, что делает. Всем, кто пробовал Cursor - советую попробовать и Antigravity. Скачать тут Затем, про Nano Banana Pro - новую версию нашумевшей модели для генерации изображений. Помимо дотренировки на тексте (посмотрим, как она справится с кириллицей), она теперь умеет смешивать до 14 изображений за раз (или до 5 людей), а также позволяет контролировать освещение, угол наклона камеры и цветовую гамму. Попробовать в Gemini Сама модель уже решила для меня сложную проблему, не потеряла контекст и в целом даже неплохо пишет код, хотя Sonnet 4.5 и пришлось за ней немного подчищать - в целом, на роль thinking/planning агента она годится отлично! Картинки - Nano Banana Pro Видео - Google Antigravity, Nano Banana Pro #Gemini #Banana #AI #BananaPro #Antigravity
1 месяц назад
Про еду из доставки, WeatherNext 2 и AgentEvolver Хотел прояснить, почему так долго не было постов - мне опять пришлось посетить больницу, на этот раз из-за еды из доставки, советую всем по возможности готовить дома :) И не повторять моих ошибок. Интересный релиз от Google был представлен недавно, модель для прогнозирования погоды с высокой точностью под названием WeatherNext 2. Она строит сотни и тысячи прогнозов на основе исторических данных, и позволяет использовать их за считанные минуты в разных продуктах Google, от поиска и Gemini, до Pixel и BigQuery. Это позволяет сильно сократить как расходы (современные прогнозы основанные на физических моделях могут занимать часы просчёта на мощных суперкомпьютерах), так и время ожидания - ведь результат получается почти мгновенно, и с большой точностью. Также интересный с исследовательской точки зрения релиз AgentEvolver, системы обучения агентов от Alibaba Tongyi Lab Это движение в сторону AI, которые самообучаются, сами задаются вопросами и сами оценивают ответы. Отмечу, что AgentEvolver-14B обходит по результатам Qwen3-235B-A22B на некоторых бенчмарках. В технические детали можно погрузиться в статье на Arxiv и вот репозиторий с самим проектом Желаю всем не болеть и реже ходить к врачам :) Видео - WeatherNext 2 Картинки - AgentEvolver #AI #GoogleAI #AIAgents #AgentEvolver #WeatherNext
1 месяц назад
Про Qwen Code 0.2.1, применение AI для не-айтишников и Google Sima 2 Alibaba Qwen зарелизили новую версию своей версии Claude Code, под названием Qwen Code. Из особо интересного - при интеграции с веб-версией Qwen вы получаете 2000 бесплатных поисковых запросов в день! В связи с этим хотел немного приоткрыть глаза на тот факт, что это инструмент не только для IT-профессионалов, а может быть полезен всем. Начнём с документации на русском. С помощью такой утилиты, вы можете: - Сделать финансовую выписку / собрать документы в кучу локально, на своём компьютере, без облака - Найти потерянные аудио / фото в огромной груде документов - Сделать конверсию форматов файлов, или распознать документы - Написать веб-приложение под вашу задачу - например, чтобы развлечь ребенка персонализированной игрой или узнать как устроена солнечная система на 3D модели Если закинуть Qwen Code (или любой другой похожий интерфейс) на сервер, открывается еще больше возможностей - он может полностью заменить многих IT-специалистов, настраивая сайт, хостинг, базу данных или почту - этого хватит с головой для большинства простых задач. Люди делают целые стартапы (MVP) совершенно без знаний программирования, следуя примеру Питера Levels - порог входа в бизнес сильно сокращается. А также хотел рассказать про визуально интересный проект SIMA 2 (Scalable Instructable Multiworld Agent) от Google - конструктор виртуальных интерактивных 3D-миров. В новой версии, агент может взаимодействовать с пользователем, думать о своих целях и задачах в виртуальном мире, а также следовать инструкциям от человека. Исследователи из Google убеждены, что это важный шаг в сторону настоящего ИИ (AGI, Artificial General Intelligence), так как добавляет "воображение" в виду осязаемого виртуального мира, вкупе с "размышлением" и самообучением, необходимыми для дальнейшего прогресса. Картинки - Qwen Code Видео - Google SIMA 2 #AI #Qwen Code #Google #Alibaba #IT #SIMA2
1 месяц назад
Про OpenAI GPT-5.1 и Qwen DeepResearch 2511 OpenAI представили обновленную версию GPT-5.1 - самой популярной модели в мире. Теперь доступна персонализация: Дружелюбный, Эффективный, Профессиональный, Прямолинейный и Игривый режимы. Релиз разделён на 2 модели - GPT5.1 Instant, который более "теплый" и более общительный. Она использует reasoning перед ответом, и более чётко следует инструкциям. А также вторая модель, GPT-5.1 Thinking, которая тратит меньше времени на размышления о легких заданиях, и больше - на сложных. Попробовать тут А Alibaba Qwen (тоже модель, которой я пользуюсь почти ежедневно) представили обновленный DeepResearch режим. Добавлена возможность выбрать "Advanced Mode" для ещё более глубокого погружения, а также наконец-то включена загрузка файлов, документов и изображений. Улучшен контроль за форматом отчёта, включая количество слов, параграфов и содержание. Попробовать тут  Скачать приложение Картинки - GPT-5.1, Qwen DeepResearch 2511 #GPT #Qwen #AInews #LLM
1 месяц назад